Vers une approche statistique pour l'indexation sémantique des documents multilingues

نویسندگان

  • Catherine Roussey
  • Farah Harrathi
  • Loïc Maisonnasse
  • Sylvie Calabretto
چکیده

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Vers une approche statistique pour l’indexation sémantique des documents multilingues Farah Harrathi, Catherine Roussey, Loïc Maisonnasse, Sylvie Calabretto

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Méthode d'apprentissage pour la conversion automatique de documents structurés

Résumé : De plus en plus de sociétés désirent moderniser leur système de gestion de fond documentaire. Le problème qui se pose à ces entreprises concerne la migration de leurs documents vers un format plus ouvert et offrant plus de possibilités. La tâche de conversion est rendue difficile d’une part à cause de la grande hétérogénéité des documents et d’autre part à cause du très grand volume de...

متن کامل

Une mesure de similarité contextuelle pour l'aide à la navigation dans un treillis

Extraction et exploitation des annotations contextuelles, Noureddine Mokhtari, Rose Dieng-Kuntz Vers une fouille sémantique des brevets: Application au domaine biomédical, Nizar Ghoula, Khaled Khelif, Rose Dieng-Kuntz Utilisation du Web Sémantique pour la gestion d’une liste de diffusion d’une CoP, Bassem Makni, Khaled Khelif, Hacène Cherfi, Rose Dieng-Kuntz Approche d’annotation automatique de...

متن کامل

F-CheX : Une approche de fouille dans les documents XML

Résumé. Nous présentons dans cet article une approche de fouille dans les documents XML qui prend en compte la structure et le contenu. Notre approche consiste à effectuer un clustering sur les documents XML. Ces derniers sont représentés par des ensembles de chemins conservant la structure arborescente des éléments. Les ensembles de chemins sont mappés dans une matrice sur laquelle une méthode...

متن کامل

Enrichissement d'ontologies grâce à l'annotation sémantique de pages web

Résumé. Nous présentons une approche pour enrichir automatiquement une ontologie à partir d’un ensemble de pages web structurées. Cette approche s’appuie sur un noyau d’ontologie initial. Son originalité est d’exploiter conjointement la structure des documents et des annotations sémantiques produites à l’aide du noyau d’ontologie pour identifier de nouveaux concepts et des spécialisations de re...

متن کامل

Etude sémantique des mots-clés et des marqueurs lexicaux stables dans un corpus technique (Semantic Analysis of Keywords and Stable Lexical Markers in a Technical Corpus) [in French]

RESUME ____________________________________________________________________________________________________________ 
Cet article présente les résultats d’une analyse sémantique quantitative des unités lexicales spécifiques dans un corpus technique, relevant du domaine des machines-outils pour l’usinage des métaux. L’étude vise à vérifier si et dans quelle mesure les mots-clés du corpus techniqu...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010